Диалоговая система на основе устных разговоров с доступом к неструктурированной базе знаний
Аннотация:
Предмет исследования. Представлен подход к построению задачно-ориентированной диалоговой системы (разговорного агента) с доступом к неструктурированной базе знаний на основе устных разговоров с применением аугментации письменной речи, имитирующей результаты распознавания устной речи, комбинирования предсказаний классификаторов, генерации текста, дополненной поиском. Метод. Предложенный подход предусматривает аугментацию обучающих данных двумя способами: преобразованием текста в речь и обратно с помощью систем синтеза и распознавания речи; заменой части слов на основе матрицы спутываний системы распознавания речи. Диалоговая система с доступом к неструктурированной базе знаний решает задачу обнаружения высказывания, для которого необходим поиск дополнительной информации в неструктурированной базе знаний. С этой целью выполнено обучение моделей Support Vector Machine, Convolutional Neural Network, Bidirectional Encoder Representations from Transformers и Generative Pre-trained Transformer 2. Лучшие из представленных моделей использованы при формировании предсказания путем взвешенного комбинирования. Осуществлен выбор подходящего текстового фрагмента из базы знаний и генерация обоснованного ответа. Поставленные задачи решены путем адаптации модели генерации текста, аугментированной поиском Retrieval Augmented Generation. Основные результаты. Выполнена апробация подхода на данных конкурса 10th Dialogue System Technology Challenge (DSTC10). По всем метрикам, кроме Precision, новый подход значительно превзошел результаты базовых моделей, предложенных организаторами конкурса DSTC10. Практическая значимость. Результаты работы могут найти применение при создании чат-бот систем, обеспечивающих автоматическую обработку обращений пользователей на естественном языке на основе неструктурированной базы знаний, например базы ответов на часто задаваемые вопросы.
Ключевые слова:
Постоянный URL
Статьи в номере
- Характеризация голографического фотополимера Bayfol HX в инфракрасной области спектра
- Исследование реакции кровеносных сосудов на локальный нагрев методом визуализирующей фотоплетизмографии
- Передача 3D голографической информации по радиоканалу методом, близким к SSB
- Влияние параметров анодирования на оптические свойства нанопористого оксида алюминия, сформированного поверх островковой пленки серебра
- Анализ точности оценивания состояний асинхронного электропривода алгоритмами Люенбергера и Калмана
- Метод оптимизации структуры в иерархических распределенных системах управления
- Метод идентификации параметров синусоидального сигнала с неизвестной переменной амплитудой
- Улучшение процесса автоматической стабилизации температуры в криовакуумной установке
- Исследование ударных свойств и износостойкости гибридных композитов Al6061 (SiC + Al2O3) и Al7075 (SiC + Al2O3)
- Вычислительные методы повышения быстродействия дискретного вейвлет-преобразования на базе FPGA
- Определение аналитических моделей динамических систем в форме дифференциальных уравнений на основе многокритериальной эволюционной оптимизации
- Вероятностный критерий оценки предсказуемости временных рядов
- Программный фреймворк для оптимизации гиперпараметров тематических моделей с аддитивной регуляризацией
- Ценностно-ориентированное моделирование принятия экономических решений в условиях нестационарности внешней среды
- Методика организации и проведения исследования по оценке потребительской способности
- Автоматизированный кластерный анализ коммуникативных стратегий образовательных telegram-каналов
- Компьютерное моделирование немарковских процессов на основе принципа баланса «комплексных вероятностей»
- Метод объективизации значений весовых коэффициентов для принятия решений в многокритериальных задачах
- Оценка границ применимости и методов модуляции ближнепольной магнитной связи
- Численно-аналитическое моделирование пропульсивного крыла и фюзеляжа аэротакси
- Применение обратной связи переменной точности для повышения быстродействия контура тока в инверторах на базе GaN-транзисторов
- Моделирование диффузионных процессов при электротермической обработке реакционных тиглей системы железо–олово